Pacotes

library(tidyverse)
library(plotly)
library(GGally)

Dados

Exemplo disponível em: Paula, G. A. (2013). Modelos de Regressão com Apoio Computacional. São Paulo, SP: IME-USP. (Exercício 23, página 112). Dados disponíveis em: https://www.ime.usp.br/~giapaula/textoregressao.htm

Neste trabalho, vamos modelar o preço de venda de imóveis a partir de dados relativos a uma amostra de 27 imóveis. As variáveis desse conjunto de dados são:

  • imposto: imposto do imóvel (em US$ 100);

  • areaT: área do terreno (em 1.000 pés quadrados);

  • areaC: área construída (em 1.000 pés quadrados);

  • idade: idade da residência (em anos);

  • preco: preço de venda do imóvel (em US$ 1.000).

Sendo assim, o objetivo dessa modelo é explicar a variável preço de venda a partir das variáveis área do terreno, área construída e idade.

dados = read.table("imoveis.dat")
colnames(dados) = c("imposto", "areaT", "areaC", "idade", "preco")
attach(dados)
dados
##    imposto   areaT areaC idade preco
## 1   4.9176  3.4720 0.998    42  25.9
## 2   5.0208  3.5310 1.500    62  29.5
## 3   4.5429  2.2750 1.175    40  27.9
## 4   4.5573  4.0500 1.232    54  25.9
## 5   5.0597  4.4550 1.121    42  29.9
## 6   3.8910  4.4550 0.988    56  29.9
## 7   5.8980  5.8500 1.240    51  30.9
## 8   5.6039  9.5200 1.501    32  28.9
## 9  15.4202  9.8000 3.420    42  84.9
## 10 14.4598 12.8000 3.000    14  82.9
## 11  5.8282  6.4350 1.225    32  35.9
## 12  5.3003  4.9883 1.552    30  31.5
## 13  6.2712  5.5200 0.975    30  31.0
## 14  5.9592  6.6660 1.121    32  30.9
## 15  5.0500  5.0000 1.020    46  30.0
## 16  8.2464  5.1500 1.664    50  36.9
## 17  6.6969  6.9020 1.488    22  41.9
## 18  7.7841  7.1020 1.376    17  40.5
## 19  9.0384  7.8000 1.500    23  43.9
## 20  5.9894  5.5200 1.256    40  37.5
## 21  7.5422  4.0000 1.690    22  37.9
## 22  8.7951  9.8900 1.820    50  44.5
## 23  6.0931  6.7265 1.652    44  37.9
## 24  8.3607  9.1500 1.777    48  38.9
## 25  8.1400  8.0000 1.504     3  36.9
## 26  9.1416  7.3262 1.831    31  45.8
## 27 12.0000  5.0000 1.200    30  41.0

Análise Descritiva

Box-plots

O gráfico interativo abaixo nos mostra as medidas resumo para cada uma das variáveis.

plot_ly(type = "box") %>%
  add_boxplot(y = imposto, name = "imposto") %>% 
  add_boxplot(y = areaT, name = "área do terreno") %>% 
  add_boxplot(y = areaC, name = "área construída") %>%
  add_boxplot(y = idade, name = "idade do imóvel") %>%
  add_boxplot(y = preco, name = "preço de venda")

Histogramas

ggpairs(dados,aes(color=I("wheat4"),fill=I("wheat2")),alpha=0.5)

ggcorr(dados,low = "red", high= "blue")